\chapter{Introducción} % (fold)
\label{cha:intro}

\begin{figure}[hb]%{r}{0.4\textwidth}
 \centering
 \includegraphics[width=0.6\textwidth]{images/sad}
 %\caption{Red P2P estructurada de Celdas de Almacenamiento}
 \label{fig:celdas}
\end{figure}

% \titlecontents{section}

%\section{Presentación} % (fold)
%\label{sec:presentacion}

La información es un bien colectivo e intangible del cual dependen los procesos
de las organizaciones modernas. El volumen de la información que éstas manejan
ha crecido y seguirá haciéndolo en los próximos años. Si se quiere enfrentar
esta tendencia, no se puede seguir pensando en los mismos mecanismos de
almacenamiento utilizados hasta hoy. Son varias las razones que obligan a
buscar alternativas; entre ellas destacan, que su operación puede resultar muy
costosa, tienen un límite en su capacidad de crecimiento, son más vulnerables
ante ataques, desastres naturales o fallas y pueden quedar fácilmente rebasados
cuando se les somete a cargas de trabajo masivas y concurrentes. Asimismo, se
observan dos tendencias que en realidad son expresiones del mismo fenómeno,
pero a diferente escala: 


\begin{enumerate}

 \item existe una necesidad creciente de intercambiar información entre
  organizaciones, aún cuando sus formatos de registro y las relaciones entre
  sus datos sean diferentes. Se puede pensar como ejemplo en el caso de dos
  instituciones de salud que requieren intercambiar expedientes clínicos.

 \item se requiere que la información pueda moverse con agilidad en los equipos
  de trabajo dentro de una organización. Como es el caso de un proyecto de
  largo plazo en el que se debe garantizar la disponibilidad de los documentos
  generados, a través del tiempo. En este escenario sería de mucho valor que un
  usuario pudiera recuperar los contenidos producidos a partir de las nociones
  o conceptos comunes a los participantes y que articulan el quehacer del
  equipo.  Por ejemplo, un profesional que llega a un grupo de investigación
  desearía recuperar aquellos contenidos relacionados con su trabajo a partir
  de conceptos propios de su especialidad.

\end{enumerate}

La primera tendencia implica la necesidad de la interoperabilidad entre
sistemas informáticos. Es claro que las organizaciones han invertido muchísimos
recursos en la construcción de sus plataformas informáticas y que ello cancela
la posibilidad de implantar un sólo estándar que unifique la representación de
la información. El problema debe abordarse estableciendo mecanismos de
conversión que traduzcan los datos desde una entidad emisora a una
meta-representación que luego pueda ``aterrizarse'' sobre la plataforma de una
entidad receptora.  

La segunda tendencia pone en relieve la importancia de la recuperación de la
información compartida por un colectivo, donde los usuarios puedan buscar los
documentos relacionados con ciertos conceptos o temas, en vez de buscar
archivos por nombre. Esto les da la capacidad de encontrar incluso aquellos
documentos cuya existencia ignoran, pero que pueden ser útiles para su trabajo,
sobretodo si se trata de un grupo que basa sus actividades en un ambiente
colaborativo.

Sin embargo, la conclusión más importante que puede obtenerse de esta reflexión
es que, en los hechos, la información ya no se encuentra almacenada en un sólo
punto. En realidad, se encuentra distribuida y requiere una revisión de los
mecanismos de intercambio para obtener el máximo beneficio y gestionar su
crecimiento.  Se trata de repensar la manera como la información se comparte en
el interior y con el exterior de una organización.

En los últimos años, los sistemas de almacenamiento distribuido (SAD) han sido
objeto de un gran interés por parte de las empresas y los grupos de
investigación en el tema. Aún cuando la función básica de estos sistemas
consiste en repartir archivos sobre un conjunto de discos conectados en red, se
reconoce también que un diseño cuidadoso puede producir funcionalidades
mejoradas y atributos de calidad superiores, particularmente aquellos
relacionados con la integridad, confidencialidad y disponibilidad de la
información. Un SAD se convierte en una opción muy atractiva para la gestión de
un volumen de información que puede crecer con el tiempo y alcanzar escalas
masivas. 

 
\section{Definición del Problema} % (fold)
\label{sec:problema}

El diseño de un SAD requiere definir i) el conjunto de requisitos funcionales y
no funcionales que se busca atender, ii) los parámetros de desempeño que
garanticen la calidad de servicio y iii) la entidad o espacio elemental de
almacenamiento. 

Los requerimientos funcionales se refieren a las necesidades del usuario o
cliente final del sistema. En tanto, los requerimientos no funcionales se
refieren a los principios de diseño del ingeniero o arquitecto que lo
construirá.  Los requerimientos funcionales de un sistema de almacenamiento
incluyen a un conjunto de entidades a cargo de: a) el monitoreo y control de
las operaciones, b) la gestión de los metadatos, c) la consistencia y la
sincronización de la información, d) la integridad y la confidencialidad, e) el
soporte del indexado y búsqueda de la información, f) el soporte del interfaz
de usuario. Por su parte, los requerimientos no funcionales de un sistema de
almacenamiento deben considerar aspectos tales como: a) la modularidad, b) la
interoperabilidad, c) la escalabilidad, d) la confiabilidad. 
 
Los parámetros de desempeño de un SAD incluyen aspectos como la cantidad de
información redundante, el balance de carga en los dispositivos de
almacenamiento y la disponibilidad de la información.
 
Por cuanto se refiere a la entidad elemental de almacenamiento, de primera
instancia podría pensarse en los discos asociados con las computadoras
participantes en un SAD.  Sin embargo, en vista de la escala a la que se puede
crecer y la complejidad de las operaciones que pueden tener lugar, se considera
contraproducente asumir una dependencia tan fuerte sobre dispositivos
individuales. Es deseable construir un dispositivo virtual que exhiba una vida
útil más prolongada y un comportamiento más estable que lo que puede esperarse
de los dispositivos físicos a partir de los cuales se construya.

% section problema (end)

\section{Contribución} % (fold)
\label{sec:contribucion}

Atendiendo las consideraciones anteriores, en este documento se describe el
diseño y la construcción de un SAD, denominado celda de almacenamiento. Una
celda está integrada por una colección de dispositivos de almacenamiento,
coordinados por un conjunto de servidores. Una solución con estas
características puede ofrecer las mismas capacidades que un sistema de
almacenamiento de alto desempeño, bajo costos de construcción y operación muy
limitados. Lo anterior hace de la celda un candidato ideal para el soporte de
aplicaciones de almacenamiento con fuertes restricciones de operación. 

% section contribucion} (end)


\section{Justificación} % (fold)
\label{sec:justificacion}

Toda organización maneja y genera información sensible que no puede permitirse
almacenar utilizando servicios brindados por terceros y, a menudo, las
soluciones de almacenamiento ``en casa'' que existen en el mercado, pueden
resultar tan costosas que quedan fuera de su presupuesto.

Las instituciones de salud, por ejemplo, requieren almacenar expedientes
electrónicos bajo fuertes exigencias tales como la disponibilidad y la
confidencialidad.  Una clínica familiar no puede costear una solución de
almacenamiento de alto desempeño, a menos que disponga de alternativas como las
que se proponen en este proyecto.

% section justificacion (end)

\section{Objetivos} % (fold)
\label{sec:objetivos}


% section objetivos (end)


\section{Metodología} % (fold)
\label{sec:metodo}

Partiendo de la literatura sobre el tema, la cual es muy extensa y heterogenea,
pudimos reconocer un conjunto de procedimientos que son comunes a todos los
proyectos con alcances y objetivos semejantes al nuestro. Para tal efecto,
seguimos la siguiente metodología:

\begin{enumerate}
 \item Identificar las características y componentes necesarios que deben
  formar parte de un sistema de almacenamiento distribuido. 

 \item Identificar los parámetros utilizados para medir el desempeño de un
  sistema de éste tipo.

 \item Proponer una arquitectura flexible, que cumpla con todos los aspectos
  anteriormente identificados.

 \item Emplear la arquitectura propuesta, para construir un prototipo.
  
\end{enumerate}

% section metodo (end)

% Aqui tienes que poner un resumen de los siguiente capítulos.
